你转发的四倍体锦鲤还好吗?NC首次鉴定出异源四倍体鱼类的祖先二倍体并成功进行亚基因组拆分
The following article is from AGCT与鱼 Author 鱼类倍性演化小组
10月11日,厦门大学徐鹏课题组最新研究成果《The allotetraploid origin and asymmetrical genome evolution of common carp Cyprinus carpio》在国际期刊Nature Communications上发表。该文以鲤为研究对象,探讨了硬骨鱼类异源四倍体的起源及其基因组不对称演化的相关机制。
异源四倍体 - 鲤
作为世界上最重要的淡水养殖鱼类之一, 鲤(cyprinus carpio)共有100条染色体,是一种异源四倍体硬骨鱼类。鲤除经历了硬骨鱼类共有的第三轮全基因组复制事件(Ts3R)外,还经历了特有的第四轮全基因组复制事件(Cs4R),因此也是广受关注的研究脊椎动物多倍体基因组演化的理想模式生物。鲤异源四倍体的祖先溯源
然而,关于鲤的身世,仍有太多未解之谜。
为了回答上述问题,我们开展了一系列研究:
要解开以上这些问题的答案,首先需要更翔实的基因组数据作为支撑。由此,我们开展了鲤3个亚种(黄河鲤、荷包红鲤、德国镜鲤)的全基因组测序工作,获得了三个染色体水平的高质量鲤参考基因组。并基于鲤250K SNP分型芯片,构建了3个高密度遗传连锁图谱。
鲤基因组物理图谱、遗传连锁图谱 | 附图1、2 & 4
鲤亚科可分为4个类群,分别为鲃类(barbine)、鲤类(cyprinine)、野鲮类(labeonine)和裂腹鱼类(schizothoracine)。2016年,中科院水生所何舜平研究员团队在《中国科学》期刊上发表了关于鲤亚科多倍体物种独立起源的相关研究论文,为异源四倍体鲤的二倍体祖先溯源工作提供了重要线索。他们分析了鲤亚科46属123种鱼类以及20种鲤亚科以外的其他鲤科鱼类,利用线粒体和核基因序列构建了系统发育关系(下图),并以此来追溯裂腹鱼类多倍体的起源及其物种分化。
从系统进化树可以看出,鲤的其中一个rag2基因与鲃系聚为一支,提示其两套亚基因组中的一个可能来源于鲃系的二倍体物种。而另一个rag2基因则单独聚为一支(正文图2a)。
受到这样的系统发育关系的启发,我们猜想,是否可以借助鲤近缘二倍体物种的基因组序列信息将其两套亚基因组进行拆分?
由此,我们选取了与鲤亲缘关系较近的云南四须鲃(Poropuntius huangchuchieni)进行全基因组测序。通过与鲤基因组序列的比对,我们发现,四须鲃基因组序列与鲤的同源染色体对(Homeologous chromosome pairs)中的一条染色体相比具有较高覆盖度(genome coverage),而与另一条染色体相比覆盖度则较低,并且这种现像在25对同源染色体中均存在。借此,我们成功将异源四倍体鲤的基因组拆分为两套来自祖先二倍体的亚基因组,各由25条染色体组成,分别命名为A亚基因组和B亚基因组。
为了更加接近鲤身世之谜的真相,我们又选取了鲃亚科另外两个近缘二倍体类群中的台湾白甲鱼(Onychostoma barbatulum)和裂峡鲃(Hampala macrolepidota),以及亲缘关系稍远的二倍体类群野鲮亚科中的鲮(Cirrhinus molitorella)进行全基因组测序,并以基因组已公开的斑马鱼(Danio rerio)和草鱼(Ctenopharyngodon idella)作为参考序列进行比较基因组学分析。
3个鲃亚科物种与异源四倍体鲤的比较基因组学分析结果显示,三者与B亚基因组比对的基因组覆盖度均显著高于A亚基因组,而草鱼(鲤科雅罗鱼亚科)、斑马鱼(鲤科
综合上述基于核基因序列的鲤亚科分子系统学研究,以及多个二倍体鲤科鱼类全基因组测序和比较基因组分析,我们鉴定出“吻孔鲃Poropuntius-小鲃Puntius-裂峡鲃Hampala”为B亚基因组最可能的祖先二倍体类群之一,而A亚基因组的祖先可能为鲤科中亲缘关系相对较远的未知物种,甚至可能是已经灭绝的物种。
为了验证这种系统进化关系,我们从单个rag2基因延伸至鲤:金线鲃:斑马鱼/草鱼/四须鲃 为2:2:1关系的2,071保守同源基因,并利用这些基因分别构建系统进化树得到整合结果,对鲤的亚基因组起源进行佐证。
什么时候形成了异源四倍体鲤?
为了计算鲤异源四倍化发生时间,利用斑马鱼、金线鲃、鲤1:2:2关系的8,270对同源基因计算得到的同义替换率Ks和已有的鲤分子钟3.51x10-9,推算出鲤和斑马鱼的分化时间为6000 万年前(60 Mya),鲤A、B亚基因组分化时间约为2300万年前(23 Mya)。而亲缘关系较近的鲤和金线鲃的分化时间为970万年前(9.7 Mya)。因此,我们推测,鲤特有的异源多倍化事件可能发生于距今970万年至2300万年间。
A、B亚基因组的转座元件序列差异(TE divergence)结果显示,鲤两个亚基因组于13%开始分化,在7%时合并形成异源四倍体鲤。由以上已知的A、B亚基因组分化于23 Mya,可将异源四倍体鲤形成时间精确到1240万年前(12.4 Mya),即鲤A、B亚基因组的共同祖先于23 Mya开始分化为两个独立的二倍体物种,之后转座元件伴随着物种分化而发生基因组尺度的序列分化,直到它们伴随着异源四倍化事件(12.4 Mya)重新融合为异源四倍体基因组后,序列分化速率才重新趋于均一。
亚基因组特征
在多倍体植物中,众多研究显示,其中一个亚基因组倾向拥有更多蛋白编码基因、保留较高的基因表达水平、经历较强的纯化选择(负选择)、维持较低的甲基化水平。这种现象称为亚基因组优势(subgenome dominance)。由此可见,十分有必要对异源四倍体鲤亚基因组基因含量、基因表达模式及表观调控等进行综合分析,以更好理解基因组合并(genome merging)后异源四倍体基因组的演化。
在比较了鲤两套亚基因组的众多特征后发现,B亚基因组大小和基因含量均显著大于A亚基因组,而GC含量、基因结构、重复元件分布等则没有显著差异。
为了方便下文鲤同源基因命运分化的研究,我们利用可获得基因组数据且最近缘的二倍体草鱼(Ctenopharyngodon idella)作为参考序列,构建了10,724个同源基因对,其中8,291对同源基因(orthologous gene triplets)在草鱼中存在一个拷贝,而在鲤A、B亚基因组分别存在一个拷贝(草鱼 :鲤A :鲤B=1:1:1)。这些同源基因在染色体上的定位极好地展现了两套亚基因组较高的共线性关系(正文图3a)。
异源四倍体鲤亚基因组不对称演化
以上分析中我们发现,B亚基因组基因含量略高于A亚基因组,这是否足够说明在异源四倍体鲤中,B亚基因组为主效亚基因组?两套亚基因组在选择压力、基因表达模式及表观调控等方面是否有差异?为了评估两个亚基因组的选择压力,我们计算了同源基因对的非同义突变和同义突变率。明显可以看出,两个亚基因组所受到的选择压力显著不同:B亚基因组经历更强的纯化选择(purifying selection,负选择),A亚基因组则经历较宽松的选择(relaxed purifying selection)。
以往在异源四倍体玉米中的研究显示,优势亚基因组较高的纯化选择会使其维持较高的基因表达水平。这种现象在同样是异源四倍体的鲤中是否同样存在?受到较强纯化选择的B亚基因组是否在基因表达水平上具有优势?
带着以上疑问,我们对鲤12个健康组织进行了转录组测序,利用以上获得的8,291对同源基因评估两个亚基因组的表达差异。结果发现,A、B亚基因组存在表达分化,在所有组织中,B亚基因组中表达水平显著高于A亚基因组的同源基因数量均高于A亚基因组中表达水平显著高于B亚基因组的同源基因数量(正文图3c)。这与B亚基因组经历更强的纯化选择一致。
通常情况下,纯化选择倾向剔除有害突变,使基因序列更加保守;而中性选择则会保留适当的变异,使基因功能具有更多可能性,而这种变化通常会降低基因原有表达水平,这也与A亚基因组较松弛的选择压力和较低的基因表达水平一致。由此可见,鲤中B亚基因组在基因表达上是主效亚基因组。
多倍体生物由于基因组的加倍,使得冗余基因拥有更多向不同功能分化的潜能。在同源四倍体大西洋鲑中,研究显示,多数基因倾向于新功能化,即产生与祖先物种该直系同源基因不同的功能。在异源四倍体鲤中,同源基因又是通过什么样的机制进行演化?
基于以上疑问,我们对近缘二倍体草鱼12个健康组织进行了转录组测序,以其基因表达水平作为祖先物种的参考。对8,291对同源基因进行表达聚类得到3个基因簇:1)鲤A、鲤B均与草鱼直系同源基因存在显著表达差异(306 triplets),提示可能发生亚功能化;2)鲤A与草鱼直系同源基因存在显著表达差异(228 triplets),提示发生新功能化;3)鲤B与草鱼直系同源基因存在显著表达差异(293 triplets),提示发生新功能化。
此外,我们还构建了鲤A、B亚基因组间的表达聚类,发现两个表达模式显著差异的基因簇,其中191对同源基因在A亚基因组高表达,而在B亚基因组几乎不表达;620对同源基因在B亚基因组高表达,而在A亚基因组几乎不表达。这种现象极有可能是同源基因对中其中一个基因发生了非功能化。
什么原因造成了一对同源基因发生如此大的表达分化?
我们对两个基因簇中同源基因进行了选择压力分析发现,无论高表达的基因位于A亚基因组还是B亚基因组,该基因总是具有更强的纯化选择,而表达沉默的同源基因则经历较宽松的选择压力。这也和我们上面提到的,纯化选择通常使得基因功能和表达水平更保守一致。
鲤A、B亚基因组表达显著差异的基因簇&不同类别基因甲基化趋势 | 正文图4c & 4e
众所周知,多倍体具有较高的环境适应性。这种在环境适应性上的优势通常是由基因组中多套拷贝基因带来的调控的灵活性。
在鲤中,环境胁迫是否会带来同源基因的表达差异?为了探究这个问题的答案,我们利用公共数据库中获得的鲤低氧(非生物胁迫)、嗜水气单胞菌感染和疱疹病毒感染(生物胁迫)的转录组数据进行一系列分析。结果发现,环境胁迫下两个亚基因组仍然存在表达差异,如eif3I基因位于A亚基因组的拷贝具有高表达,而位于B亚基因组的拷贝则不表达。此外,在整体水平上,环境胁迫会加剧两个亚基因组的表达差异,并且B亚基因组依然具有表达优势(正文图3e & 3f)。
为了准确反映异源四倍体基因组的环境胁迫响应,十分有必要利用同源基因对的整体表达水平另作分析。我们发现,将一对同源基因作为一个整体分析时,显著响应于该胁迫的基因数量明显降低。由此可见,基因组复制带来了大量冗余基因,增加了异源四倍体基因组的表达可塑性,使其在面对环境胁迫时可通过调控一对同源基因的表达来减少因表达剧烈变化可能带来的不利影响。
本研究可以看出,大多数同源基因仍然保留保守的表达模式和基因功能,因此,在多倍体物种中,利用同源基因总体的表达水平进行转录调控分析,不失为一种新的思路。
鲤碱基替换与甲基化替换的关系 | 正文图4a
基因组背景下甲基化水平&表达显著差异基因甲基化水平 | 正文图4b & 4d
Summary
课题组先后完成了黄河鲤、荷包红鲤和德国镜鲤三个鲤亚种的全基因组序列图谱,并利用鲤高密度SNP分型芯片完成了三个亚种的高密度遗传连锁图谱绘制。 通过对上百种近缘四倍体和二倍体鲤亚科(鲃系)鱼类精细的分子系统学研究,确定了潜在的祖先二倍体类群,随后通过全基因组测序和基因组相似性比较分析,鉴定出“吻孔鲃Poropuntius-小鲃Puntius-裂峡鲃Hampala”为最可能的鲤祖先二倍体类群之一,初步完成了异源四倍体鲤的二倍体祖先溯源,并将鲤异源四倍体起源定位距今1200万年前中新世中期的东亚地区,时间上与青藏高原东部剧烈隆升驱动的气候变化事件高度重叠。 在上述基础上,利用鲤同源染色体序列与近缘二倍体祖先基因组序列的相似性差异,首次成功将异源四倍体鲤基因组拆分为两个各由25条染色体组成的亚基因组,进而评估了鲤亚基因组水平的结构变异、基因和转座元件组成、同源基因(homoeologs)表达分化和表观修饰水平分化。结果表明,鲤异源四倍体基因组仍然保留了完整的两套二倍体亚基因组,并未发现在多倍体基因组中常见的基因丢失和重新二倍化(rediploidization)现象,却观察到大量同源基因不对称表达分化和表观修饰差异,揭示了鲤基因组通过精细调整两套基因的表达水平而非基因突变和丢失来维持正常生命功能的基因组倍性演化模式。
点击左下角“阅读原文”下载文章正文~
参考文献:
文献精读
往期精品
后台回复“生信宝典福利第一波”获取教程合集